Vychází třetí generace procesorů Epyc s architekturou Zen 3. AMD s nimi ještě zvětšilo náskok, který má ve výkonu a energetické efektivitě proti Xeonům, také ale odskočilo konkurenci z táboru ARM.
V listopadu AMD vydalo desktopové Ryzeny 5000 „Vermeer“ , teď v roce 2021 se k tomu přidaly mobilní Ryzeny 5000 „Cezanne“ . A včera pak byla nová architektura Zen 3 s vylepšeným výkonem doplněná do poslední oblasti, v které ještě chyběla: v serverech. Firma včera odhalila a oficiálně vypustila na trh serverovou verzi Zenu 3, procesory „Milan“, neboli třetí generaci procesorů Epyc.
Epyc třetí generace: 7nm + Zen 3
Epyc Milan má označení také jako řada „7003“, všechny modely této generace mají tedy na konci číselného označení trojku (například Epyc 7763), podle níž poznáte, že jde o CPU s architekturou Zen 3.
Milan/Epyc 7003 má opět čipletové řešení, kdy v pouzdru je jeden velký IO čiplet a osm malých CPU čipletů. CPU čiplety obsahují osm jader Zen 3 v jednom bloku CCX s 32MB L3 cache a jsou stejné, jaké AMD používá v desktopových Ryzenech 5000, výroba je na první generaci 7nm procesu. IO čiplet je 12nm a vypadá to, že je stejný, jako AMD používalo v generaci Rome (7702) se Zenem 2 . Respektive asi jde o refresh původního návrhu (v některých zdrojích se objevilo, že má odlišný počet tranzistorů, ale velikost je stejná).
V tomto čipletu se nachází osmikanálový paměťový řadič s podporou DDR-3200 (s ECC) a řadič PCI Expressu 4.0 se 128 linkami. Dále také obsahuje logiku pro komunikaci s CPU čiplety a propojení všech jader (respektive bloků CCX a jejich jader/L3 cache).
Epyc Milan tedy upgraduje architekturu jader CPU, kde by mělo dojít k výraznému navýšení výkonu, ale v konektivitě a samotné platformě jsou jen malé změny a procesor je v tomto ohledu podobný Epycům druhé generace, s jejichž platformou je kompatibilní.
Je použitý stejný socket SP3 a upgrady serverů by měly být tedy hodně snadné (jako vždy bude třeba nejdřív aktualizovat firmware/BIOS desky). Milan/7003 by jinak měla být poslední generace na platformě SP3, další generace „Genoa“ v roce 2022 už bude na novém socketu SP5 s pamětí DDR5 a PCI Expressem 5.0 .
Kromě architektury Zen 3 AMD v Milanu dodalo ještě nějaké další novinky, takovou by měla být například oficiální podpora běhu s jen čtyřmi a nově také šesti aktivními paměťovými moduly, což umožní lépe přizpůsobit kapacitu (drahé) RAM plánovanému využití serveru, byť za cenu nižší propustnosti. Běh s méně DIMMy, než je počet paměťových kanálů, byl sice asi možný už dřív, ale teď by to mělo být oficiálně podporované včetně plného interleavingu aktivních kanálů.
IO čiplet běží na vyšší frekvenci
V IO čipletu je ještě jedna změna. Zatímco u Rome (Epyc 7002) nebyla frekvence Infinity Fabric synchronní s frekvencí pamětí, v Milanu už to tak je. S pamětí DDR4-3200 tedy běží Infinity Fabric na 1600 MHz. Toto zlepšilo latence pamětí, latence při komunikaci mezi jádry i výkon Infinity Fabric, ale také zvýšilo příkon konzumovaný IO čipletem a propojeními s CPU čiplety.
Spotřeba IO čipletu by měla být snad až 40 % spotřeby celého procesoru, přičemž zatímco spotřeba jader CPU se v nečinnosti sníží na minimum, spotřebu IO čiplet v nečinnosti zdá se procesor moc zredukovat neumí.
Až 64 jader, novinka jsou 56 a 28jádrové verze
Parametry procesorů Milan jsou dané kombinací IO čipletu a CPU čipletů. Maximální počet jader, který nabízejí nejvýkonnější a nejdražší modely, je proto pořád 64 (což dává 128 vláken díky SMT). Počet linek PCI Express 4.0 zůstal stejný, 128 pro jeden procesor. Dvouprocesorová sestava jich část používá pro propojení obou CPU, takže typicky také bude nabízet do 128 linek, ale je možné také snížit kapacitu propojení a poskytnout až 160 linek PCIe 4.0 pro připojená zařízení jako jsou GPU a NVMe SSD.
AMD nabízí konfigurace procesorů s osmi (ty mají celkově 256 MB L3 cache) nebo čtyřmi CPU čiplety (ty mají 128 MB L3 cache) uvnitř. Přičemž v každém čipletu může být část jader vypnutá – v extrémním případě tak existují dokonce procesory s jen osmi jádry, ale 256 MB L3 cache, protože CPU je tvořeno osmi čiplety, kde v každém je aktivní jediné jádro (a 32MB blok L3).
Novinkou jsou konfigurace, kde je v každém čipletu aktivní lichý počet jader, což nebylo dříve možné, protože čiplet se dělil na dva CCX, kde v každém musel být schodný počet jader. Toto nyní umožňuje AMD nabízet Epycy s 56 a 28 jádry, nebo ono osmijádro s plnou L3 cache.
Modely můžete vidět zde v tabulce. Nejvýkonnější Epycy 7003 v nabídce představují 64jádrové modely – Epyc 7763 má 64 jader s taktem 2,45 GHz v základu a maximálním boostem 3,5 GHz, jeho TDP je ale 280 W, což je navýšení proti standardům předchozí generace, kde 280W modely byly uvedené až později jako specialita pro sektor HPC .
Vedle něj existuje také úspornější stále 225W Epyc 7713 , stále 64jádro, ale na taktu 2,0 GHz v základu a 3,675 GHz v maximálním boostu (jednovláknový boost je vyšší možná proto, že tento model má čipy s vyšší leakage, kdežto 7763 jsou využité ty s nižší leakage – to umožňuje nižší spotřebu při dané frekvenci a tím vyšší MT výkon, ale zase hůře škálují na vysoké takty).
Modely pro 1S sestavy
V tabulce modelů si můžete všimnout ještě dvou kategorií speciálních modelů. Procesory s příponou P na konci názvu mají zvýhodněnou cenu (například Epyc 7713P stojí „jen“ 5010 $ proti Epycu 7713 za 7060 $). Jejich parametry jsou sice stejné jako u ne-P modelů, ale podporují jen 1S desky, ne dvousocketové.
Modely optimalizované na frekvenci
V serverech sice často jsou výhodné procesory s co největším počtem jader a absolutním výkonem, ale ne pro všechny aplikace. Často jsou preferována CPU s menším počtem jader, ale s vyšší frekvencí a výkonem jednotlivého jádra. Například tam, kde je software (draze) licencován za poplatky odstupňované podle počtu jader. Pro tyto aplikace jsou určené modely s označením „F“, které ale není přidané na konec čísla, ale trošku méně přehledně nahrazuje předposlední číslici v čtyřciferném modelovém čísle. (Tuto řadu AMD zavedlo v generaci Rome loni ).
Nejvyšší model této pod-kategorie je Epyc 75F3 . Ten má jen 32 jader, ale plnou 256MB L3 cache (v osmi 32MB blocích vždy pro čtyři jádra) a 280W TDP. S ním dosahuje základní takt 2,95 GHz a maximální boost až 4,0 GHz. Běžné 32jádro 7543 (nebo 1S verze 7543P) má frekvence jen 2,8–3,7 GHz s TDP 225 W. Tyto modely F jsou dále nabízené s 24 jádry (74F3 na 3,2–4,0 GHz), 16 jádry (73F3 na 3,5–4,0 GHz) a osmi jádry (72F3 na 3,7–4,1 GHz).
Modely „F“ mají pro maximalizaci výkonu na jádro vždy 256 MB L3 cache, zatímco běžné modely mají s ubývajícím počtem jader většinou jen 128 MB L3 a tedy jen čtyři CPU čiplety. Anomálií je 28jádrový model Epyc 7453 (2,75–3,45 GHz, 225 W), jenž je osekán na jen 64 MB L3. AMD v něm zřejmě uplatňuje čiplety s vadou v bloku L3 cache, kdy je polovina deaktivovaná.
Chybí procesory s nízkou spotřebou nebo nízkou cenou
Co v nabídce nápadně chybí, jsou nějaké procesory s TDP nižším, než 165 W, což nechává hodně prostoru pro serverové procesory Intelu, které se jinak celkovým výkonem na Epyc 7003 nebudou moc chytat. Zde je zřejmě na vině to, že IO čiplet má poměrně velkou spotřebu, která je u procesorů Milan vždy přítomná jako režie, přičemž tato režie se možná od Rome ještě zvětšila. AMD proto v této části nabídky hodlá dál nabízet procesory Epyc 7002 s architekturou Zen 2; při těchto nízkých TDP možná ani Zen 3 nemá moc velkou výhodu.
Toto je viditelná slabina čipletové koncepce, která dobře pokrývá nejvýkonnější segmenty trhu, ale má problémy škálovat níž. Uvidíme, zda se s tím AMD podaří vypořádat v budoucnosti. Třeba tím, že by vyrábělo ještě separátní úsporný čiplet třeba jen se čtyřkanálovým řadičem pamětí (který by pak také umožnil zlevnit a zefektivnit Threadrippery).
Podobně jako chybí modely s nízkou spotřebou, také není příliš modelů s nízkou cenou, nabídka začíná okolo 900–1100 $, takže také lowend je ponechán Intelu (lowendové modely Xeon Bronze, Xeon Silver) nebo starší generaci Epyc 7002 Rome. V těchto nižších cenových patrech asi také kvůli čipletové koncepci nemají Epycy svou jinak velkou výhodu v energetické efektivitě, takže na tomto masovém trhu je 14nm Intel konkurenceschopnější.
AMD obecně Epycy 7003 poněkud zdražilo proti modelům 7002 Rome. Je to asi výraz toho, jak roste výkonnostní náskok proti Xeonům od Intelu a zároveň pozice AMD na trhu, kdy už není vnímáno jako tak druhořadý hráč jako v minulosti a může si vzhledem k výkonu za procesory říct o víc. Toto zvýšení cen by teoreticky mohlo také být proto, aby při vyjednávání byl větší prostor pro slevy, takže je možné, že největší zákazníci reálně o tolik víc nezaplatí. Nevýhoda je to ale velká pro ty, kdo kupují jen pár kusů CPU v retailu. Ti zaplatí typicky doporučenou částku, která proti generaci Rome dost narostla.
Galerie: AMD Epyc 7003 Milan
Pokroky v energetická efektivitě jsou omezené
To, že nejsou Epycy s architekturou Zen 3 a TDP nižším, než je 165 W, také asi trošku souvisí s tím, že Zen 3 zvýšil absolutní výkon, ale je to i za cenu vyšší spotřeby (viz 280W TDP u nejvyššího modelu). Energetická efektivita tedy stoupla méně, než absolutní výkon. Je to i tím, že je použitý stále prvogenerační 7nm proces (N7) jen s drobnými inkrementálními zlepšeními, ne nová technologie EUV (proces N7+) nebo vylepšený ne-EUV proces N7P. Nemluvě o přechodu na 6nm nebo 5nm proces.
Epycy 7003 by se nyní měly postupně začít objevovat v nabídce výrobců serverů a také v instancích cloudových poskytovatelů. Největší speciální klienti údajně tyto procesory dostávali již dlouho před vydáním (snad již od třetího čtvrtletí roku 2020), takže se mohli připravit dopředu a v nějaké míře už asi Milan používají v praxi.
Na webu už jsou první testy výkonu: například od ServeTheHome , Phoronixu a AnandTechu . Jeden Epyc Milan podle nich typicky poráží dva nejrychlejší procesory Xeon Platinum od Intelu, případně 2S Epyc 7003 zase dokáže nahradit s o něco vyšším výkonem 4S sestavu Intel. Toto nicméně už celkem platilo pro generaci Epyc 7002 Rome, jež také měla 64 jader (jen to byl Zen 2) a 7nm proces. Milan/Epyc 7003 ale přidává další náskok navíc. Současně také nechává celkem přesvědčivě za sebou ARM vyzyvatele Ampere Altra s 80 jádry .
Intel skutečnou konkurenci teprve chystá
Intel by měl ovšem zanedlouho kontrovat vlastní novou generací, Xeony Ice Lake-SP poprvé s 10nm procesem. U těch se očekává, že by mohly být trošku rozporuplné kvůli tomu, že stále používají problematickou první (nebo druhou, pokud by se počítalo Cannon Lake) generaci 10nm procesu, ne vylepšenou technologii SuperFin . Navýší ale počet jader, takže by je AMD nemělo zdaleka válcovat tak snadno, jako 14nm Xeony a v úlohách akcelerovaných instrukcemi AVX-512 by mohly i vítězit – ale až recenze ukáží, jak se jim podaří očekávání naplnit.